智能论文笔记

Transformers Improve Breast Cancer Diagnosis from Unregistered Multi-View Mammograms

Xuxin Chen , Ke Zhang , Neman Abdoli , Patrik W. Gilley , Ximin Wang , Hong Liu , Bin Zheng , Yuchen Qiu

分类：计算机视觉 | 人工智能

2022-06-21

深度卷积神经网络（CNN）已被广泛用于各种医学成像任务。但是，由于卷积操作的内在局部性，CNN通常不能很好地对远距离依赖性进行建模，这对于准确识别或映射从未注册的多个乳房X线照片计算出的相应乳腺病变特征很重要。这促使我们利用多视觉视觉变形金刚的结构来捕获一项检查中同一患者的多个乳房X线照片的远程关系。为此，我们采用局部变压器块来分别学习从两侧（右/左）乳房的两视图（CC/MLO）获得的四个乳房X线照片中。来自不同视图和侧面的输出被串联并馈入全球变压器块，以共同学习四个代表左乳房和右乳房两种不同视图的图像之间的贴片关系。为了评估提出的模型，我们回顾性地组装了一个涉及949套乳房X线照片的数据集，其中包括470例恶性病例和479例正常情况或良性病例。我们使用五倍的交叉验证方法训练和评估了模型。没有任何艰苦的预处理步骤（例如，最佳的窗户裁剪，胸壁或胸肌去除，两视图图像注册等），我们的四个图像（两视频两侧）基于变压器的模型可实现案例分类性能在ROC曲线下的面积（AUC = 0.818），该区域的表现明显优于AUC = 0.784，而最先进的多视图CNN（p = 0.009）实现了0.784。它还胜过两个单方面模型，分别达到0.724（CC视图）和0.769（MLO视图）。该研究表明，使用变压器开发出高性能的计算机辅助诊断方案，这些方案结合了四个乳房X线照片。

translated by 谷歌翻译

National research evaluation initiatives and incentive schemes have previously chosen between simplistic quantitative indicators and time-consuming peer review, sometimes supported by bibliometrics. Here we assess whether artificial intelligence (AI) could provide a third alternative, estimating article quality using more multiple bibliometric and metadata inputs. We investigated this using provisional three-level REF2021 peer review scores for 84,966 articles submitted to the UK Research Excellence Framework 2021, matching a Scopus record 2014-18 and with a substantial abstract. We found that accuracy is highest in the medical and physical sciences Units of Assessment (UoAs) and economics, reaching 42% above the baseline (72% overall) in the best case. This is based on 1000 bibliometric inputs and half of the articles used for training in each UoA. Prediction accuracies above the baseline for the social science, mathematics, engineering, arts, and humanities UoAs were much lower or close to zero. The Random Forest Classifier (standard or ordinal) and Extreme Gradient Boosting Classifier algorithms performed best from the 32 tested. Accuracy was lower if UoAs were merged or replaced by Scopus broad categories. We increased accuracy with an active learning strategy and by selecting articles with higher prediction probabilities, as estimated by the algorithms, but this substantially reduced the number of scores predicted.

translated by 谷歌翻译

尽管深度学习架构最近取得了成功，但在现实词应用程序中，人重新识别（REID）仍然是一个具有挑战性的问题。最近，已经提出了几种无监督的单目标域适应性（STDA）方法，以限制源和目标视频数据之间通常发生的域移位引起的REID准确性下降。鉴于人REID数据的多模式性质（由于跨摄像头观点和捕获条件的变化），训练常见的CNN主链来解决跨多个目标域的域移动，可以为实时REID应用程序提供有效的解决方案。尽管在REID文献中尚未广泛解决多目标域的适应性（MTDA），但一种直接的方法包括混合不同的目标数据集，并在混合物上执行STDA以训练公共CNN。但是，这种方法可能导致概括不佳，尤其是在融合越来越多的不同目标域来训练较小的CNN时。为了减轻此问题，我们基于知识蒸馏（KD-REID）引入了一种新的MTDA方法，该方法适用于实时人员REID应用。我们的方法通过从多个专业的教师CNN中蒸馏出来，适应了目标域上常见的轻型学生骨干CNN，每个CNN都适用于特定目标域的数据。对几个具有挑战性的人REID数据集进行的广泛实验表明，我们的方法优于MTDA的最先进方法，包括混合方法，尤其是在训练像OSNET这样的紧凑型CNN骨架时。结果表明，我们的灵活MTDA方法可用于设计成本效益的REID系统，以实时视频监视应用程序。

translated by 谷歌翻译

近年来，传感器技术中有前所未有的技术进步，传感器变得比以往任何时候都更实惠。因此，传感器驱动数据收集越来越多地成为全球研究人员的吸引力和实用的选择。这些数据通常以时间序列数据的形式提取，这可以用数据挖掘技术来研究，以总结一系列受试者的行为，包括人类和动物。虽然启用廉价和质量收集数据，但连续传感器数据记录在大小和体积中大的数据集，这是在及时处理和分析传统技术的具有挑战性。这种收集的传感器数据通常以时间序列数据的形式提取。文献中有两种主要方法，即基于形状的分类和基于特征的分类。基于形状的分类根据距离测量确定最佳类。另一方面，基于功能的分类，根据时间序列定义的功能，找到时间序列的属性并找到最佳类。在本文中，我们证明这两种技术都不会使一些问题占主导地位，但两者都可能是最好的。换句话说，在一个问题上，可能的技术可以更好地对行为的一个子集更好，而另一技术对于另一个行为的子集更好。我们介绍了一种混合算法来分类行为，使用两个形状和特征措施，在从传感器收集的弱标记时间序列数据中，以量化由受试者执行的特定行为。我们展示了我们的算法可以基于形状和特征的组合，强大地分类真实，嘈杂和复杂的数据集，并在现实世界数据集中测试了我们所提出的算法。

translated by 谷歌翻译